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摘要 : 

[目的 ] 为 解决 排版 人 员 手 动 制作 美观 、 易 读 的 报纸 版 面 布局 耗费 大 量 时 间 成 本 问题 。 本 文 
提出 一 种 数字 报 版 面 布局 自动 生成 方法 。 

[方法 ] 本 文 方法 结合 贝 叶 斯 网 络 推断 和 约束 规划 技术 。 首 先 基于 历史 版 面 数 据 和 专家 经 验 
对 数字 报 版 面 的 结构 和 属性 进行 推断 , 然后 利用 推断 结果 建立 混合 整数 约束 规划 模型 计算 版 
面 布局 ， 从 而 显著 减少 规划 模型 求解 空间 ， 提 高 布局 质量 。 

结果 ] 本 文 构建 并 公开 了 一 个 中 文 版 面 数 据 集 。 该 数据 集 由 数字 报 版 面 图 片 和 相应 的 新 闻 
内 容 组 成 , 并 带 有 详细 版 面 新 闻 属 性 标记 。 进行 了 用 户 研究 , 结果 表明 了 我 们 方法 的 有 效 性 。 
UR] 本 文 注重 于 排版 元 素 类 型 和 大 小 对 布局 的 影响 ， 未 考虑 到 文本 、 图 片 语义 与 布局 之 
间 的 联系 。 
[结论 ] 本 文 方法 可 以 高 效 生成 多 种 带 有 历史 风格 且 直 观 、 易 读 的 版 面 布局 。 
关键 词 ， 贝 叶 斯 网 络 ”上 近邻 ”整数 规划 约束 规划 
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Abstract: 

[Objective] To solve the problem that typesetters spend a lot of time and cost in 
manually making beautiful and readable newspaper layout. This paper presents an 
automatic generation method of digital newspaper layout. 

[Methods] This method combines Bayesian network inference and constrained 
programming technology. Firstly, based on the historical layout data and expert 
experience, the structure and attributes of the digital newspaper layout are 
inferred, and then the inference results are used to establish a mixed integer 
constrained programming model to calculate the layout, so as to significantly reduce 
the solution space of the planning model and improve the layout quality. 

[Results] This paper constructed and published a Chinese layout data set. The data 
set is composed of digital newspaper page pictures and corresponding news content, 
with detailed page news attribute tags. The results of user research show the 


effectiveness of our method. 
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[Limitations]This paper focuses on the influence of typesetting element type and 
size on layout, without considering the relationship between semantics of pictures 
and texts and layout. 

[Conclusions] This method can efficiently generate a variety of intuitive and 
readable layout with historical style 
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新 闻 报 纸 作 为 一 种 传统 主流 信息 媒介 ， 国 家 统计 局 报告 2020 年 全 国 报纸 出 
版 种 类 1810 种 ， 总 印 数 达 289. 1 亿 份 [1]， 仍 值得 我 们 的 重视 。 目 前 新 闻 报 纸 的 
排版 大 都 由 专业 设计 人 员 完 成 , 一 方面 , 通过 微 博 、 公 众 号 等 方式 进行 新 闻 发 布 ， 
为 获取 时 效 性 而 舍弃 了 原 有 的 美观 排版 ， 另 一 方面 , 通过 人 工 编 排 报纸 之 后 进行 
发 布 ， 虽 然 保 留 了 版 面 的 美观 ， 时 效 性 却 大 打折 扣 。 因 为 整个 设计 流程 对 人 工 的 
依赖 较 高 ,， 尤其 是 对 图 片 和 文本 进行 排列 组 合 , 确定 其 相对 位 置 以 及 样式 规格 以 
保证 版 面 的 可 读 性 、 信 息 性 和 美观 性 。 这 样 通过 人 工 手动 排版 报纸 ,会 进行 大 量 
重复 劳动 ， 耗 时 费力 ， 使 得 新 闻 出 版 效率 低下 。 

近 几 年 来 ， 有 许多 专家 学 者 对 页 面 布局 生成 方法 进行 了 研究 [2] 。 例 如 : Æ 
成 杂志 封面 [3-5]， 生 成 漫画 布局 [6-8], 广告 图 像 布局 [9-12]， 他 们 更 多 考虑 的 
是 图 形 元 素 设 计 ， 通 过 图 形 传达 信息 与 表达 美感 ， 信 息 性 不 足 。 例 如: 为 科技 论 
文 自动 生成 科技 海报 [13], 虽然 考虑 了 图 形 和 文本 的 信息 性 , 但 是 页 面 内 面板 关 
联 性 较 强 ， 没 有 体现 主 次 分 明 的 层次 感 且 多 样 性 不 足 。 例 如 : 整数 规划 网 格 布局 
设计 [14-16]， 很 好 地 为 用 户 提供 合适 且 多 样 性 的 布局 ， 然 而 布局 元 素 既 没有 体 
现 主 次 也 没有 存续 以 往 的 风格 特征 。 一 般 来 说 ,生成 页 面 布局 需要 确定 两 部 分 内 
A: 1. 整个 页 面 的 结构 ， 这 描绘 了 布局 的 骨架 。2. 每 个 排版 元 素 的 属性 值 ， 包 括 
位 置 大 小 和 内 容 ， 这 确定 了 骨架 的 细节 。 文 献 [4, 17-18] 通 过 专家 模板 来 确定 布 
局 结构 ， 这 能 有 效 保证 生成 布局 的 性 能 ， 例 如 : 文献 [4 利用 专家 模板 并 学 习 美 
学 设计 准则 ， 将 生成 杂志 封面 转化 为 能 量 优化 问题 求解 。 文 献 [6, 8, 10-11, 13] 
则 通过 数据 驱动 的 方式 学 习 布 局 特征 ; 例如 : 文献 [13] 使 用 概率 图 模型 来 推断 元 
素 属性 ， 沿 着 二 又 树 递归 搜索 最 佳 分 割 位 置 ， 确 定 具 体 结构 参数 ， 文 献 [9] 使 用 
概率 模型 来 推断 成 本 函数 ， 转 而 求解 优化 问题 。 文 献 [14-16] 用 数学 约束 来 描述 
布局 元 素 的 大 小 位 置 ; 例如 : 文献 [14] 用 混合 整数 线性 规划 模型 确保 排版 元 素 的 
打包 、 对 齐 、 分 组 和 优先 定位 ， 有 效 生成 高 质量 布局 。 文 献 [19-23] ， 将 神经 网 
络 应 用 到 页 面 布 局 生成 领域 ; 例如 文献 [19], 提出 一 个 基于 内 容 感 知 的 布局 生成 
模型 ， 用 对 抗 生 成 网 络 模拟 布局 分 布 。 这 可 以 生成 高 质量 的 布局 , 但 需要 大 量 细 
粒度 数据 来 训练 模型 且 模型 构建 较为 困难 。 据 我 们 文献 调研 ， 现 有 方法 并 不 能 完 
美 解决 报纸 排版 问题 。 

针对 于 本 文生 成 报纸 版 面 问 题 ,版 面 内 新 闻 块 以 及 新 闻 块 内 部 的 标题 、 文 本 、 
图 片 被 视 为 排版 元 素 , 每 个 元 素 拥 有 若干 位 置 大 小 和 内 容 属 性 。 版 面 结构 数量 众 
多 而 且 排 版 元 素 的 位 置 、 大 小 、 内 容 参 数 之 间 相 互 关联 ， 基 于 数据 驱动 模型 可 以 
较 好 地 学 习 元 素 内 部 联系 却 难以 精确 推断 属性 值 , 而 规划 模型 可 以 基于 目标 精确 
求解 但 很 难 描述 元 素 之 间 的 内 在 联系 且 求 解 空间 较 大 。 要 根据 新 闻 内 容 特征 对 报 
纸 进 行 编排 ， 尤 其 是 得 到 版 面 规范 且 美 观 ， 信 息 清晰 有 层次 的 报纸 版 面 ， 仍 然 是 
一 项 具有 挑战 性 的 任务 。 


本 文 提出 了 一 种 融合 学 习 与 规划 的 数字 报 版 面 布局 自动 生成 方法 。 我 们 通过 
历史 版 面 数 据 集 学 习 布 局 特征 并 结合 模型 推断 属性 构建 混合 整数 约束 规划 模型 ， 
规划 模型 根据 排版 目标 确定 版 面 布 局 和 排版 元 素 属 性 值 , 最 终生 成 报纸 版 面 。 我 
们 的 方法 包括 排版 新 闻 素材 信息 提取 和 版 面 生 成 两 部 分 。 对 于 信息 提取 , RINE 
过 脚本 预 处 理 用 户 提 交 对 应 格式 的 文档 得 到 新 闻 内 容 特 征 以 及 用 户 的 排版 设置 。 
本 文 的 重点 在 于 版 面 布局 生成 过 程 ， 我 们 分 三 个 步骤 来 实现 这 个 过 程 : 首先 ， 引 
入 二 又 树 结构 来 表示 版 面 结 构 , 并 进一步 设计 最 近邻 方法 来 根据 新 闻 属 性 来 推断 
可 用 的 版 面 结构 ， 使 其 保持 历史 风格 并 确保 生成 多 样 性 的 版 面 ， 其次， 基于 专家 
经 验 设计 了 贝 叶 斯 网 络 并 进行 参数 学 习 ， 对 版 面 内 新 闻 块 属性 建立 推 邮 模型 ， 利 
用 模型 推断 关键 属性 后 验 分 布 , 减 小 后 续 模 型 变量 搜索 空间 ; 最 后 ， 利 用 二 又 树 
结构 自动 构建 版 面 结构 混合 整数 约束 规划 模型 , 利用 推 央 属性 为 新 闻 块 属性 设 定 
合理 区 间 ， 为 版 面 设置 约束 和 目标 来 生成 整体 协调 、 规 范 、 美 观 的 报纸 版 面 。 本 
文通 过 约束 规划 确定 位 置 大 小 内 容 参 数 , 不 仪 保证 布局 的 对 齐 \ 不 重合 、 不 溢出 ， 
还 考虑 了 图 文 比例 和 矩形 比例 和 留 白 等 美学 特性 保证 美观 性 ,通过 头条 位 置 ,不 
同 新 闻 字 号 的 特殊 性 等 属性 为 新 闻 提 供 了 层次 感 , 而 且 部 分 属性 基于 模型 预测 生 
成 ， 这 保留 了 版 面 历史 风格 。 此 外 ， 通 过 设置 多 种 可 用 版 面 和 新 闻 放 置 序列 ， 本 
方法 可 以 自动 生成 多 个 版 面 。 


1 数据 集 介绍 


一 张 报纸 版 面 由 若干 个 新 闻 区 块 组 成 , 他 们 包含 各 自 的 内 容 元 素 , 包括 标 
题 、 副 标题 、 正 文 及 图 片 等 。 每 个 新 闻 区 块 之 间 有 相对 规范 的 分 隔 与 内 容 属性 差 
T, 体现 了 报纸 版 面 的 清晰 性 、 层 次 性 、 可 读 性 、 美 观 性 。 为 了 研究 版 面 布局 结 
构 以 及 相关 属性 之 间 的 联系 , 我 们 制作 了 一 个 报纸 版 面 的 数据 集 ， 该 数据 集 包括 
171 个 报纸 版 面 ， 共 958 篇 新 闻 。 这 些 报 纸 版 面 均匀 选 自 2020 年 全 年 的 《今日 
金东 》 报 纸 ， 以 保证 样本 之 间 的 平衡 性 。 我 们 利用 PPOCRLabel[24] 半 自动 化 图 
形 标注 工具 手动 标注 了 50 张 版 面 的 布局 信息 ， 并 利用 了 PaddleDetection[24] 
目标 检测 项 目 进行 训练 ， 自 动 标注 了 剩 下 的 新 闻 页 面 。 对 于 每 张 报纸 版 面 ， 我们 
标记 了 每 个 新 闻 块 的 大 小 和 位 置 属 性 ， 以 及 新 闻 块 内 容 属性 ， 包 括 标题 大 小 ， 正 
文大 小 图 片 元 素 的 大 小 。 此 外 ， 借 助 合作 报 企 的 数据 库 ， 我 们 得 到 了 对 应 新 闻 块 
的 标题 、 副 标题 、 正 文 内 容 及 长 度 和 新 闻 类 型 。 


2 版 面 布局 生成 方法 


在 本 节 中 , 我 们 将 概述 框架 内 容 和 介绍 数据 集 属性 。 本 文 提出 的 版 面 生成 方 
法 融合 了 机 器 学 习 和 混合 整数 约束 规划 两 种 模型 , 通过 学 习 模 型 推断 版 面 结 构 和 
预测 新 闻 元 素 属性 ,并 用 于 构建 规划 模型 。 如 图 1 所 示 我 们 将 版 面 生成 的 过 程 分 
为 三 个 阶段 。 首 先 从 用 户 新 闻 素 材 提 取 排 版 信息 ， 这 包括 新 闻 内 容 特征 提取 和 用 
PRE: 然后 基于 内 容 特 征 推断 版 面 的 布局 结构 集合 和 部 分 元 素 属性 ; 最 后 构建 
规划 模型 求解 布局 。 由 于 我 们 的 数据 集 较 小 , 而 且 版 面 结构 和 元 素 属性 均 只 需要 
模糊 的 预测 区 间 以 保证 版 面 风格 ， 最 后 通过 规划 模型 精确 求解 。 为 了 便于 实现 ， 
我 们 分 别 使 用 最 近邻 方法 来 预测 版 面 结构 集 合 和 贝 叶 斯 网 络 来 预测 新 闻 属 性 。 最 
近邻 方法 训练 时 间 快 且 准 确 度 较 高 而 基于 专家 经 验 设计 的 贝 叶 斯 网 络 可 以 较 好 
的 描述 元 素 属性 之 间 的 内 部 联系 。 
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图 1 版 面 布局 生成 框架 。 

图 1 版面 布局 生成 框架 。 框 架 主 要 包括 四 个 部 分 : 1. 信息 提取 ， 预 处 理 用 
户 提 交 的 排版 素材 ， 获 取 新 闻 特 征 和 用 户 设 置 ，2. 预测 可 用 结构 ， 在 训练 数据 中 
学 习 最 近邻 模型 来 推断 可 用 布局 结构 集合 ;3. 预测 新 闻 属性 ,在 训练 数据 中 学 习 
概率 图 模型 来 推断 头条 新 闻 区 块 的 宽度 属性 和 新 闻 区 块 内 图 形 元 素 的 大 小 ; 4. 
规划 模型 构建 与 求解 ,基于 页 面 结构 与 特定 元 素 的 属性 推断 值 构建 模型 进一步 
规划 所 有 元 素 具 体 属性 值 。 
2.1 新 闻 属 性 介绍 

我 们 的 数据 集 包括 一 组 数字 报 版 面 P 和 其 相对 应 的 页 面 结构 S$， 每 个 版 面 p 
拥有 对 应 的 页 面 结 构 *， 且 版 面 由 若干 个 新 闻 区 块 2 组 成 ， 每 个 版 面 有 且 只 有 一 
个 头条 新 闻 区 块 。 每 个 新 闻 区 块 拥有 主 标题 、 副 标题 、 文 本 、 图 形 4 种 元 素 ， 其 
中 主 标题 和 正文 是 必 不 可 少 的 。 对 于 包含 n 个 新 闻 区 块 的 版 面 ， 每 个 新 闻 区 块 b 
拥有 如 下 属性 : 

新 闻 区 块 相 对 版 面 宽度 w 和 高 度 h; 

新 闻 主 标题 字数 atitle, ， 主 标题 相对 全 版 面 字数 a, = atitle, / Datitle, ; 

新 闻 副 标题 字数 fide,， 副 标题 相对 全 版 面 字数 = file / ftitle, ; 

新 闻 文 本 字数 text; ， 文 本 相对 全 版 面 文本 字数 1 = text, / X text, ; 

新 闻 图 片 数量 gs ， 版 面 图 片 总 数 G=》g,; 

新 闻 图 形 元 素 相 对 于 版 面 的 尺寸 gs ， 版 面 整体 图 片 相对 尺寸 Gs = 》 gs, ; 

新 闻 类 型 7, 新 闻 类 型 分 4 种 , 头条 , 图 片 新 闻 (正文 面积 远 少 于 图 片面 积 )， 


A Aerial, EX T, € {Head,Gragh,WithGragh,Nogragh \ 。 
2.2 版 面 结构 推断 

在 本 文 方法 中 , 生成 的 报纸 版 面 结果 集合 体现 多 样 性 ， 这 不 仅 需 要 新 闻 样 式 
之 间 组 合 ， 以 保证 排版 规范 和 整体 布局 的 美观 , 而 且 要 求 版 面 拥 有 多 样 的 结构 以 
增加 用 户 选 择 。 为 此 ,我 们 提出 了 最 近邻 方法 来 推断 可 用 的 页 面 结构 集合 。 我 们 
假设 每 个 新 闻 区 块 为 盾 形 ， 所 有 先 形 边 水 平 垂 直 或 平行 ,不 重合 ,不 溢出 ， 刚 好 
组 成 一 个 完整 的 矩形 版 面 , 这 种 可 二 分 结构 包含 了 绝 大 部 分 报纸 页 面 结构 ,为 了 
描述 版 面 结构 ， 即 秆 形 之 间 的 关系 。 


页 面 结构 C(RO(RO(CO0))ROO) 


图 2 二 叉 树 表示 页 面 布 局 结构 

我 们 借鉴 了 生成 科技 海报 布局 [13] 和 漫画 布局 [6] 工 作 的 想法 ， 引 入 二 又 树 
来 表示 报纸 的 布局 ， 并 作为 报纸 页 面 的 结构 类 型 。 在 2. 3 节 中 ,二 又 树 结构 将 为 
规划 模型 提供 矩形 之 间 的 拓扑 约束 。 如 图 2 所 示 ， 左 边 为 版 面 结构 ， 右 边 为 对 应 
的 二 叉 树 结构 。 我 们 用 二 叉 树 的 叶子 节点 表示 每 个 新 闻 区 块 ， 而 非 叶 子 节点 包括 
两 种 类 型 ，C 类 型 节点 表示 将 矩形 纵 问 分 割 成 水 平 两 个 子 矩形 ，R 类 型 节点 表示 
将 矩形 横向 分 割 成 垂直 两 个 子 抢 形 。 为 了 避免 结构 重复 ， 每 一 次 横 癌 分割 都 位 于 
最 左边 ， 每 一 次 纵向 分 割 都 位 于 最 上 边 。 所 以 新 闻 区 块 划分 是 按照 从 左 到 右 ， 从 
上 到 下 的 顺序 。 在 数据 集中 ， 我 们 使 用 二 又 树 的 先 序 胃 历 顺 序 表示 页 面 结构 。 


(a) 结 构 1 无 效 DATA (o) 结构 3 有 效 


图 3 无效 和 有 效 的 页 面 结构 示例 


结构 类 型 
图 4 历史 版 面 类 型 分 布 


页 面 结构 数量 随 着 新 闻 块 数量 成 巨 量 增长 。 将 一 个 矩形 划分 成 mn 个 小 矩形 ， 
当 n PE LOW, AMAA 1, 2, 6, 25, 128, 758, 5014, 36194, 
280433[25] 。 然 而 其 中 充斥 着 无 效 结构 〈 并 不 适合 作为 报纸 版 面 结构 如 图 
3a, 3b) ， 对 于 常用 的 版 面 结构 却 不 过 几 十 种 。 如 图 4， 第 三 种 结构 类 型 在 数据 
集中 占 42 个 版 面 ， 占 数据 集 总 版 面 数 的 24. 56%。 鉴 于 此 ， 我 们 基于 版 面 内 容 属 
性 来 确定 页 面 结 构 , 将 页 面 结构 的 获取 视 为 一 个 分 类 问题 。 在 本 文中 ,我 们 使 用 
最 近邻 方法 来 实现 。 

特征 标准 化 ; 与 相关 领域 排版 专家 交流 发 现 , 页 面 结构 主要 取决 于 每 个 新 闻 
区 块 的 尺寸 ， 我 们 将 第 i 个 新 闻 区 块 内 容 的 相对 尺寸 size, 作 如 下 定义 : 


size, =A,-a,+4,-f,+4,:t,+4,°8, (1) 


其 中 二 元, 大 分 别 为 报纸 版 面 中 主 标题 ， 副 标题 ， 正 文 ， 图 片 的 平均 相对 
尺寸 。 对 于 一 篇 拥有 n 篇 新 闻 的 版 面 p, ， 我 们 将 该 样本 的 特征 向 量 久 定义 为 : 


VW = | size, „size, „size, | (2) 
size, < size, ,Vj €[2,n), j € N“ (3) 


其 中 ,cc 为 1,2,..,n 的 一 个 序列 ， 并 满足 size, 为 头条 相对 尺寸 。 
样本 距离 ;使 用 欧式 距离 作为 样本 距离 ， 版 面 p, 与 p, 之 间 的 距离 dist(u,v) 定 
义 为 : 


dist(u.v)=|(V,, -V,,.)-V,, -V,,)" (4) 

分 类 方式 ; 由 于 同样 的 新 闻 内 容 根据 排版 的 需求 可 能 有 多 个 结构 选择 , 我 们 
的 目的 是 基于 新 闻 内 容 得 到 版 面 结构 集合 , 所 以 本 文 将 邻近 的 k 个 结构 作为 可 用 
结构 集合 。 
2.3 头条 宽度 及 图 形 尺寸 推断 

本 文 方法 通过 混合 整数 约束 规划 的 方法 来 求解 版 面 属性 值 。 这 主要 包括 两 方 
面 ， 一 是 新 闻 块 位 置 坐标 ， 二 是 新 闻 内 容 属性 值 ， 包 括 主 标题 字号 、 主 标题 样式 
(横竖 ) 、 正 文 栏 数 、 图 片 尺寸 以 及 各 元 素 间 距 等 。 规 划 模 型 的 解 空间 非常 大 ， 
此 外 , 为 了 追求 多 样 性 布局 ,我们 还 要 对 不 同 版 面 结构 下 对 新 闻 顺 序 进 行 循 环 计 
算 ， 这 将 极 大 的 增加 计算 压力 。 为 了 减 小 解 空 间 ， 我 们 分 别 使 用 贝 叶 斯 网 络 模型 
来 推断 头条 新 闻 块 的 宽度 和 图 片 元 素 的 尺寸 。 贝 叶 斯 网 络 结构 是 基于 领域 专家 的 
指导 下 建立 ， 模 型 参数 在 我 们 的 数据 集 上 进行 训练 。 

头条 新 闻 是 报纸 版 面 中 ， 最 为 重要 的 内 容 信息 。 一 般 情 况 下 ， 头 条 新 闻 在 版 
面 中 占据 最 重要 的 位 置 (通常 位 于 版 面 最 上 方 ) 以 及 拥有 较 大 的 尺寸 。 大 致 确定 
头条 新 闻 的 宽度 后 , 不 仅 可 以 有 效 勾 画 出 版 面 新 闻 块 的 宽度 高 度 属性 , 而 且 新 闻 
块 宽度 很 大 程度 影响 着 内 容 属 性 ,头条 新 闻 宽 度 主 要 受到 头条 内 容 和 页 面 结构 的 
影响 。 我 们 假设 每 个 新 闻 区 块 之 间 内 容 都 是 相互 独立 的 。 头 条 宽度 wy， 主要 取决 
于 头条 的 主 标题 wy，、 副 标题 上， 、 文 本 图 片 数量 g ,和 页 面 结构 ,图 5 
贝 叶 斯 网 络 表 示 了 头条 宽度 与 内 容 之 间 的 联系 。 
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5 用 于 推断 头条 宽度 的 贝 叶 斯 网 络 结构 


我 们 使 用 贝 叶 斯 估计 来 学 习 模 型 参数 的 条 件 概率 分 布 《CPD) ， 将 头条 新 闻 
宽度 推断 作为 最 大 后 验 假设 问题 CMAP) ， 定 义 如 下 : 


Wise = arg max P(Wyeaa |s,a, f,t,G) (5) 


图 片 元 素 是 新 闻 块 中 重要 的 视觉 元 素 ， 图 片 的 大 小 直接 影响 版 面 的 视觉 传 
达 。 在 后 续 规 划 模 型 中 ,图片 大 小 与 新 闻 块 比例 大 小 相关 ， 通 过 变量 乘积 不 等 式 
来 约束 ， 求解 空间 大 。 为 了 获得 合适 的 图 片 大 小 ,我 们 通过 贝 叶 斯 网 络 来 推断 图 
片 的 大 至 尺寸。 一 般 情 况 下 ,报纸 图 片 的 大 小 主要 取决 于 图 片 的 重要 性 。 在 本 文 
中 ， 图 片 的 重要 性 与 新 闻 类 型 挂钩， 头条 图 片 最 为 重要 ， 其 次 为 图 片 新 闻 ， 最 后 
为 有 图 新 闻 。 在 我 们 的 贝 叶 斯 网 络 中 , 新 闻 块 的 图 片 元 素 大 小 主要 取决 于 新 闻 块 
的 主 标题 、 文 本 、 图 片 数 以 及 新 闻 类 型 。 我 们 同样 使 用 贝 叶 斯 估计 来 学 习 模 型 参 
数 的 条 件 概率 分 布 CPD) ， 将 图 片 元 素 大 小 推断 作为 最 大 后 验 假设 问题 (MAP)， 
定义 如 下 : 


gs =argmax P(gs |T,a,t,G) (6) 
gs 


0.00 0.08 0.16 0.0 0.5 1.0 
图 片 相对 面积 & 头条 相对 宽度 whcag 
Ca) 图 片 相对 面积 分 布 (pb) 头条 相对 宽度 分 布 
6 历史 版 面 图 片面 积 与 头条 宽度 分 布 

如 图 6 所 示 ， 由 于 数据 有 限 ， 而 且 版 面 风格 导致 新 闻 块 变量 集中 的 分 布 在 几 
个 区 间 内 。 所 以 我 们 将 各 个 变量 进行 了 离散 化 处 理 , 将 预测 宽度 区 间 内 的 平均 宽 
度 作 为 我 们 的 推测 宽度 。 预 测 元 素 大 小 区 域 平 均值 作为 预测 大 小 。 
2.4 约束 规划 模型 

在 这 一 小 节 中 ， 我 们 将 介绍 一 个 混合 整数 约束 规划 模型 用 于 生成 报纸 版 面 。 
模型 约束 通过 结构 二 又 树 、 新 闻 内 容 、 属 性 预测 值 来 建立 。 在 基于 前 两 节 的 属性 
预测 上 ， 我 们 把 关键 属性 值 确定 在 一 个 较 小 区 间 ， 从 而 有 效 降 低 总 的 求解 空间 ， 
提高 效 紊 。 当 版 面 内 的 新 闻 数 量 确定 后 ， 决 俩 变量 的 数量 就 不 再 变化 , 与 其 他 因 
素 无 关 。 我 们 生成 报纸 版 面 的 要 求 主 要 有 三 个 : 1. 每 个 新 闻 块 矩形 ， 对 齐 良好 ， 


布置 在 报纸 版 面 上 没有 空洞 且 不 会 溢出 版 面 ;如 (1) 所 述 。2. 新 闻 的 图 文 比例 合 
适 、 头 条 及 各 个 新 闻 块 符合 报纸 风格 ;如 (2) 所 述 。3. 新 闻 块 之 间 整 体 协调 且 各 自 
之 间 清 晰 有 差异 主 次 分 明 ; 如 (3) 所 述 。 
(1) 页 面 结构 约束 

我 们 在 报纸 版 面 平面 定义 坐标 系 ， 左 上 角 为 坐标 系 原点 ，X 轴 疝 右 为 正 ，Y 
轴 向 下 为 正 。 为 了 描述 每 个 新 闻 块 的 位 置 和 大 小 ,我 们 定义 了 决策 变量 x,y,w,h。 
其 中 xz, 表示 新 闻 块 左上 顶点 的 坐标 ;wmw 交 表示 新 闻 块 的 宽度 和 高 度 。 我 们 借助 
2.2 引入 的 二 又 树 结构 来 实现 第 一 个 目标 ， 其 中 的 叶子 节点 表示 版 面 新 闻 块 矩 
形 ， 非 叶子 节点 表示 被 划分 和 矩形。 在 这 里 我 们 定义 中 间 变 量 多 ,7, 所 ,4 分别 表示 
FEM PS RATE B 华 标 和 宽 高 ， 节 点 按照 二 又 树 的 先 序 遍 历 顺 序 依次 表示 。 


Bi 
= 
et] [rignt 


= 。 
Bi 
| 


页 面 结构 C(RO(RO(CO0O0))(ROO) 


图 7 二 又 树 结构 转 化 页 面 结构 

如 图 7 所 示 ， 根 据 我 们 对 非 叶子 节点 的 定义 ， 每 个 非 叶 子 节点 矩形 有 横竖 
CRC) 两 种 划分 方式 。 对 于 二 又 树 中 任意 非 叶 子 节 点 ， 我 们 通过 以 下 约束 保证 它 
们 之 间 的 结构 关系 。 


NO 用 HH 0) 


N, (ig —H,) + (1= N,)-(Wigg —W)=0 (8) 
N, (hw ~ H,) +0 N,)- Wy W) =0 0) 
Xin =X Va =Y, (10) 
Xag t Wi =X, +W, yg + hg =Y +H, (11) 


FEF xin Viens Mens hieno Siam Y nens Wao han 分 别 表示 第 i 个 非 叶子 节点 矩形 的 左 孩 
子 和 右 孩 子 的 位 置 和 大 小 。W, 表示 节操 类 型 ，C 类 型 节操 取 值 为 1，R 类 型 取 值 
0。 每 个 矩形 都 会 根据 它 的 祖先 节点 来 组 织 它 的 周边 结构 。 当 页 面 结构 确定 之 后 ， 
我 们 可 以 通过 这 一 系列 公式 来 构建 一 个 版 面 的 骨架 结构 。 公 式 保 证 每 个 新 闻 块 不 
会 互相 重 登 、 不 会 洪 出 版 面 并 且 拥 有 民 好 的 对 齐 性 。 
(2) 内 容 约 束 以 及 基于 推断 进一步 约束 

我 们 将 一 篇 新 闻 对 应 一 个 矩形 块 , 一 篇 新 闻 的 所 有 内 容 元 素 必须 合适 的 组 织 
在 这 个 矩形 里 边 。 在 本 文中 , 我 们 将 新 闻 内 容 元 素面 积 转化 为 占据 矩形 面积 的 高 
度 ， 只 要 新 闻 内 容 高 度 不 超过 矩形 高 度 ， 即 留 白 高 度 大 于 等 于 0。 关 于 元 素 组 织 
的 合理 性 ， 我 们 只 考虑 标题 的 字号 大 小 和 横竖 方式 ， 以 及 图 片 的 大 小 和 比例 ， 而 


正文 元 素 直 接 根据 矩形 宽度 来 计算 相应 高 度 。 具体 样式 微调 优化 参见 我 们 的 男 一 
部 分 工作 [26] .为 了 保持 矩形 块 内 元 素 组 织 的 合理 性 , 我 们 主要 考虑 了 以 下 约束 : 
1. 横竖 标题 样式 titeStyle 取决 于 新 闻 块 矩形 的 宽 高 比 ， 我 们 设 定 了 阀 值 来 确 
定 ， 这 个 阔 值 是 通过 我 们 数据 集 所 有 坚 排 标题 的 最 小 高 宽 比 确定 。 


1 i hy > Vite te’ Wis 
titleStyle, | igs (12) 


0 otherwise 


2. 为 了 获得 具有 历史 图 文 比例 风格 和 头条 风格 的 版 面 ， 图 片 大 小 gs, 和 头条 
宽度 wi 主要 取决 于 基于 2. 3 的 贝 叶 斯 网 络 的 预测 值 。 其 中 ,为 可 放松 阐 值 。 


(l-k): gs, < gs, <(1+k,)- gs, (13) 


(l 下 k,) ` Wread = Whead = a + k,) 3 Wread (14) 


w 


3. 图 片 宽 高 比例 变化 不 能 太 大 以 保持 图 片 的 清晰 度 , BA AREER 
专家 经 验 。 


(l—k,)-7,- gw, < gh, <(1+k,)-7,- gw; (15) 


其 中 gw gh AB DER RE, r 为 图 片 原始 高 宽 比 ， HEARE. BAA 
容 高 度 计 算是 非 线性 的 ,给 我 们 带 来 了 更 高 的 计算 成 本 。 我们 通过 使 用 机 器 学 习 
模型 推断 来 减 小 求解 空间 ， 降 低 计 算 成 本 ， 同 时 得 到 具有 风格 特色 的 版 面 。 

(3) 整体 布局 与 用 户 偏 好 

为 了 实现 版 面 的 全 局 目标 , 使 得 新 闻 块 之 间 整 体 协 调 且 主 次 分 明 。 报纸 版 面 
中 的 新 闻 是 有 重要 程度 之 分 的 。 因为 没有 对 新 闻 进 行 语义 分 析 , 我 们 要 求 用 户 标 
注 每 篇 新 闻 的 等 级 (重要 性 ) 。 为 了 实现 目标 ,我 们 补充 指标 来 描述 整体 的 布局 
状态 。1. 新 闻 层 次 : 新 闻 等 级 影响 对 应 新 闻 块 标题 大 小 ,更 重要 的 新 闻 会 拥有 更 
大 字号 的 标题 。2. 新 闻 块 留 白 : 我 们 希望 得 到 更 少 的 新 闻 留 白 ， 尽量 使 得 新 闻 填 
满 整个 版 面 。3. 新 闻 块 矩形 比例 : 我 们 对 和 矩形 比例 合适 的 情况 进行 奖励 ， 越 接近 
黄金 比例 奖励 越 高 。 如 图 8 所 示 ， a 中 ， 新 闻 ! 等 级 更 高 ， 新 闻 块 5 中 新 闻 
相 比 新 闻 块 bp 中 的 拥有 更 大 的 标题 字号 ; (b〉 中 ， 我 们 希望 新 闻 块 尽 可 能 像 b， 
拥有 更 少 的 留 白 ， 而 不 是 ; Cc) 中 ， 新 闻 块 矩形 5b 比例 更 接近 黄金 比例 ， 模 
型 对 它 的 奖励 大 于 6b 的 奖励 ， 模 型 将 会 尝试 寻找 全 局 奖励 最 大 的 解 。 


副标题 


| 


图 8 整体 布局 目标 具体 表现 


基于 已 定义 的 决策 变量 , 我 们 可 以 非常 轻松 的 实现 一 些 用 户 指令 。 例如 指定 
任意 两 篇 新 闻 之 间 相 对 位 置 ,新闻 1 必须 放置 在 新 闻 2 的 正 上 方 , 我 们 可 以 根据 
新 闻 序 列 得 到 它们 对 应 的 新 闻 块 1，j， 只 需要 增加 约束 即 可 : yth <y o FEE, 
我 们 也 可 以 指定 新 闻 相 对 版 面 的 位 置 , 例如 将 头条 新 闻 放 在 版 面 最 上 方 。 除 此 之 
外 ,我 们 也 可 以 具体 指定 某 一 篇 新 闻 的 字号 大 小 、 图 片 比例 等 属性 。 对 于 留 白 较 
大 的 区 域 ， 我 们 填充 适当 的 报 花 ， 方 法 参见 我 们 的 另 一 部 分 工作 [26] 。 
(4) 总 结 
算法 1 概述 了 生成 版 面 的 整个 过 程 。 步 又 2，3 根据 新 闻 内 容 分 别 推断 版 面 
结构 和 图 形 元 素 的 大 小 属性 ;步骤 5 基于 结构 和 内 容 推 央 头条 宽度 ;步骤 6-11 
根据 不 同 的 结构 和 新 闻 序 列 建立 约束 规划 模型 进行 求解 ， 步 又 12 松弛 对 留 白 、 
头条 、 图 片 尺寸 的 约束 来 生成 更 多 的 解 。 
Algorithm1: Generate Layouts 
输入 : PIAA articles 与 用 户 设置 setting 
1: 初始 化 版 面 集合 天 = 六 
2: 推断 可 用 页 面 结构 9 = knn(articles) 
3: 推断 版 面 内 图 片 尺 寸 Cs = bys(articles) 


TS 


5: ”推断 头条 宽度 wy = bys(articles,s) 


6: while |F|| < 要 求 的 版 面 数量 : 
7: for 每 个 未 使 用 的 新 闻 序列 seq: 


8: 建 规划 模型 wi S, OS —> cpmodel 
9: if cpmodel 求解 出 布局 f : 

10: 布局 添加 到 集合 =F 了 Uf 
11: 标记 新 闻 序 列 seq 已 使 用 

12: ”放松 留 白 头条， 图 片约 束 阐 值 


输出 : 版 面 布局 集合 F 
算法 1 版 面 布 局 生成 算法 


3 ”实验 结果 


推断 模型 ， 将 推断 可 用 结构 、 头 条 宽度 和 图 形 矿 寸 均 视 为 分 类 问题 。 我 们 利 
用 历史 优秀 版 面 数据 集 对 推断 模型 进行 训练 与 验证 。 由 于 数据 集 较 小 ,我们 对 于 
版 面包 含 不 同 区 块 数量 , 采用 交叉 验证 的 方式 进行 模型 训练 与 验证 。 训练 集 与 测 
试 集 比例 为 4 1。 数 据 集 包含 4 篇 新 闻 的 版 面 10 个 ，5 篇 新 闻 的 版 面 51 个 ，6 
篇 新 闻 的 版 面 80 个 。 

规划 模型 ; 融合 了 学 习 模 型 的 预测 约束 , 可 以 生成 多 样 性 的 结果 并 延续 历史 
风格 。 我 们 在 过 去 一 年 里 《今日 金东 》 报 纸 中 随机 抽取 报纸 版 面 并 提取 其 中 包含 
的 新 闻 内 容 ， 标 记 好 每 篇 新 闻 的 等 级 。 对 于 性 能 定量 分 析 ; 我 们 从 计算 时 间 和 布 
局 数量 角度 ， 分 别 在 新 闻 内 容 特 性 方面 对 比分 析 了 本 文 方法 相 较 于 纯 规 划 模 型 
《没有 融合 预测 约束 ) 的 性 能 。 

用 户 定 性 分 析 ; 我 们 邀请 了 5 位 没有 经 历 过 排版 培训 的 在 校 学 生 作为 排版 新 
手 。 要 求 他 们 在 学 习 了 历史 版 面 后 ， 随 机 选择 一 篇 版 面 新 闻 内 容 进 行 排版 ， 力 求 


版 面 的 可 读 性 、 信 息 性 与 美观 性 。 随 后 邀请 10 位 用 户 进行 评估 ， 通 过 比较 新 手 、 
专家 (已 出 版 版 面 )、 规 划算 法 和 本 文 方法 生成 的 版 面 布局 在 不 同 指标 下 的 得 分 ， 
来 验证 我 们 方法 的 有 效 性 。 我 们 为 用 户 提 供 以 下 三 个 评价 指标 : 1. 可 读 性 : 单 篇 
新 闻 的 清晰 度 , 主要 体现 在 版 面 内 部 新 闻 之 间 界 限 、 新 闻 内 部 元 素 之 间 界 限 的 清 
晰 性 ，2. 信息 性 : 在 阅读 报纸 版 面 新 闻 时 ， 能 够 轻松 获取 版 面 的 重要 信息 ; 3. 
美观 性 ， 在 不 考虑 新 闻 内 容 的 情况 下 ， 对 报纸 版 面 的 美学 感受 。 
3.1 推断 模型 定量 分 析 
版 面 结构 推断 ; 一 般 意义 的 最 近邻 分 类 方法 在 给 定 测试 样本 后 , 基于 样本 距 
离 找 出 训练 集中 与 之 靠近 的 k 个 训练 样本 ， 并 以 样本 间距 离 倒数 加 权 “ 投 票 ” 方 
式 得 到 合适 的 类 别 。 由 于 同样 的 新 闻 内 容 根据 排版 的 需求 可 能 有 多 个 结构 选择 ， 
我 们 的 目标 是 基于 新 闻 内 容 得 到 合适 的 版 面 结构 , 所 以 我 们 将 与 测试 样本 邻近 的 
k 个 样本 的 结构 全 部 作为 我 们 的 可 用 结构 $ , 而 不 是 投票 选 出 唯一 的 分 类 结果 y ， 
显然 seS' 。k 值 偏 大 会 导致 无 效 结构 增多 ， 并 增加 后 续 相 应 的 计算 压力 ; 而 k 
值 偏 小 则 会 导致 错失 可 行 结构 , 使 得 最 终 版 面 的 结构 较为 单一 , 减少 多 样 性 。 我 
们 对 准确 率 定 义 如 下 : 
accuracy = > TS pues S prea)/ > 1 (16) 


l, if sins, © S =S a5 
HS 8 )= ý (17) 
(Sre pred) | oth še 


其 中 5, 是 数据 集 和 人 人工 排版 的 版 面 原始 结构 ，s,, FETED ZG o 
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图 9 准确 率 随 k 值 变化 曲线 


如 图 9 所 示 , 我 们 对 k 进行 依次 取 值 在 数据 集 上 进行 5 TAS MME, 对比 随 
机 方法 《随机 选取 一 个 版 面 ) 、 本 文 方法 和 最 近邻 方法 〈 选 出 唯一 结构 ) ， 并 寻 
找 尽 可 能 小 的 k 值 而 使 推断 准确 率 尽 可 能 高 。 最 近邻 方法 相 比 于 随机 选取 方法 ， 
最 近邻 方法 准确 率 优势 明显。 而 本 文 方法 选取 最 近 的 个 版 面 结构 集合 , 准确 率 
高 于 上 述 两 种 方法 ,更 进一步 ,我 们 将 预测 结构 中 与 原始 结构 相同 个 数 作 为 指标 ， 
比较 了 不 同 k 值 下 的 本 文 方法 和 随机 选取 K 个 版 面 方法 的 性 能 。 如 图 10 所 示 ， 
本 文 方法 推断 的 结构 更 接近 原始 结构 。 

e= D Taia (18) 


此 外 , 为 了 比较 二 者 实际 对 排版 结果 的 影响 。 对 于 包含 6 篇 新 闻 的 版 面 ， 选 
定 k=15 值 后 ， 我 们 随机 挑选 了 5 个 版 面 的 内 容 ， 按 照 两 种 方法 得 到 的 结构 进行 
排版 。 平 均 结 果 如 表 1 所 示 ， 对 于 本 文 方法 得 到 的 结构 集合 , 包含 的 结构 数量 
少 ， 排 版 得 到 平均 布局 数量 反而 更 多 ， 排 版 时 间 更 短 ， 更 加 适合 新 闻 内 容 。 本 文 
提出 的 推断 版 面 结 构 最 近邻 方法 可 以 提高 排版 效率 。 


4 篇 新 闻 一 一 本 文 方法 
hy i 。 …… 随机 取 k 个 版 面 
MG 3 i 


图 10 预测 结构 c 值 随 k 值 变化 曲线 


表 1 不同 预测 结构 排版 结果 


方法 结构 数量 布局 数量 平均 布局 数量 时 间 ( 秒 ) 
随机 k 个 版 面 6.0 40. 0 6.7 62. 34 
本 文 方法 4.4 35. 2 8.0 45. 01 


新 闻 属 性 推断 ; 我 们 将 头条 宽度 和 图 片 尺寸 同样 作为 分 类 问题 。 为 其 划分 取 
值 区 间 , 将 落 入 区 间 内 的 训练 样本 平均 值 作为 预测 值 。 我们 用 准确 率 和 相对 误差 
RE 来 描述 我 们 的 推断 模型 性 能 。 


RE= |pred 一 true| 


(19) 


true 
其 中 pred HHE, true 为 原始 版 面值 。 我 们 得 到 的 预测 结果 如 下 表 2 所 示 。 
表 2 属性 预测 结果 


头条 宽度 图 片 尺 寸 
新 闻 (篇 ) 
准确 率 误差 准确 率 误差 
4 0.70 0.11 0.73 0. 29 
5 0. 89 0. 10 0. 50 0. 25 


6 0. 81 0. 23 0. 74 0. 20 
3.2 计算 性 能 分 析 
本 文 推 断 模 型 分 别 利用 scikit-learn[27] 中 最 近邻 分 类 模型 和 pgmpy [28] 

中 贝 叶 斯 网 络 模型 实现 ， 规 划 模 型 使 用 Google 开源 的 OR-Tools 中 CP-SAT 作为 
约束 规划 的 求解 器 [29]， 均 使 用 Python3. 8 编写 。 我 们 的 实验 在 配置 为 8 核 64 
位 Intel(R) Core (TM) i7-4790 3. 60GHz CPU 和 8GB RAM 的 计算 机 上 进行 。 我 们 
使 用 本 文 方法 生成 多 组 版 面 , 每 组 版 面 拥 有 相同 内 容 , 每 个 版 面 均 包 含 6 篇 新 闻 。 

K 3 每 个 步骤 的 平均 运行 时 间 

排版 步 又 平均 时 间 CBD) 

信息 提取 0. 06 
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预测 版 面 结构 0. 06 
预测 新 闻 属 性 0. 08 
求解 规划 模型 3. 64 


表 3 显示 了 每 个 步骤 所 需 的 平均 时 间 。 运 行 时 间 明 显 少 于 专业 人 员 和 新 手 制 
作 报纸 版 面 所 花费 的 时 间 。 我 们 的 方法 平均 不 到 4 秒 即 可 生成 一 个 版 面 布局 。 
在 确定 结构 和 新 闻 序 列 后 ， 求 解 规划 模型 的 时 间 性 能 会 受到 新 闻 内 容 的 影 
响 。 我 们 一 方面 考虑 了 版 面 中 头条 新 闻 尺 寸 size 、 新 闻 总 尺寸 size,、 新 闻 尺 十 
标准 差 std, 和 图 片 数 量 G 对 模型 性 能 产生 的 影响 ， 另 一 方面 ， 对 学 习 到 的 新 闻 属 
即 为 规划 模型 融合 不 同 的 推断 属性 ,分 析 其 性 能 影响 。 其 中 相 
对 尺寸 通过 公式 (1) 计算 ，n 表示 版 面 内 新 闻 数 量 。 
Size, = > size, (20) 


bep 


std , = sqrt(> (size, — size, /n)’/n) (21) 

我 们 记录 了 新 闻 内 容 在 相同 页 面 结 构 和 新 闻 序列 下 , 规划 模型 和 本 文 方法 的 
求解 时 间 和 布局 数量 ， 所 有 版 面 新 闻 内 容 从 数据 库 中 按 相 应 指标 线性 插值 取出 。 
下 图 11、12， 显 示 了 各 种 方法 在 不 同 新 闻 内 容 特 征 下 的 性 能 表现 。 
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图 11 布局 数量 随 版 面 内 容 特 征 变化 曲线 
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12 排版 时 间 随 版 面 内 容 特征 变化 曲线 


不 同 新 闻 内 容 会 影响 到 排版 的 效率 ,头条 尺寸 、 内 容 尺寸 标准 差 和 图 片 数 量 
增加 会 导致 我 们 方法 的 时 间 性 能 优势 相对 提升 , 内 容 总 的 尺寸 增加 会 使 得 时 间 性 
能 下 降 。 相 较 于 纯 规 划 模 型 ， 我 们 方法 的 总 时 间 只 有 其 10% 到 40% 之 间 。 因 为 约 
束 更 少 , 纯 规划 模型 可 以 生成 更 多 的 布局 数量 ,本 文生 成 布局 数量 只 有 纯 规 划 模 
型 的 一 半 不 到 (20-100 之 间 ) 。 这 是 因为 实验 考虑 到 美观 性 和 性 能 的 平衡 ， 只 
有 对 留 白 约束 进行 放松 , 没有 对 图 片 、 头 条 相关 约束 进行 放松 , 理论 上 本 文 方法 
布局 数量 上 限 就 是 纯 规划 模型 。 对 于 消融 实验 ， 当 图 片 数量 较 少 时 , 带 有 头条 约 
束 的 模型 与 本 文 方法 变化 趋势 高 度 相 似 ， 如 图 11、 图 12 中 a，p，c。 这 是 因为 
头条 尺寸 极 大 影响 整个 版 面 的 结构 和 相对 尺寸 , 此 时 图 片 尺寸 约束 更 多 是 对 不 良 
版 面 的 筛选 ， 影 响 相 对 较 小 。 而 随 着 图 片 数 量变 化 ， 如 图 11d。 带 有 图 片 尺寸 约 
束 的 模型 与 本 文 方法 性 能 变化 趋势 相似 。 图 片 越 多 ， 图 片 尺寸 对 版 面 影响 越 大 。 
3.3 用 户 定性 评估 

我 们 邀请 了 10 位 在 校 学 生 作为 用 户 , 对 不 同方 法 生成 的 报纸 版 面 的 可 读 性 、 
信息 性 和 美观 性 进行 评估 。 


pin 


# 4 用 户 评分 结果 


HEIA TRE 7 iam g 美观 性 布局 数量 
平均 分 ”最 高 分 “平均 分 “最 高 分 “平均 分 “最 高 分 “平均 分 最 高 分 
专家 9.0 9.0 9.2 9.2 9.4 9.4 9.2 9.2 1 
新 手 8.4 8.4 7.8 7.8 8.0 8.0 8.3 8.3 1 
纯 规划 方法 。 7.8 8.4 6.8 7.6 7.2 7.8 6.8 7.8 4 
本 文 方法 8.4 8.6 8.4 8.8 8.0 8.6 8.0 8.8 4 


每 位 用 户 会 拿 到 包含 同样 内 容 而 排版 样式 不 同 的 5 组 版 面 , 并 要 求 对 版 面 从 
0 到 10 进行 评分 ， 其 中 0、10 分 别 表示 相应 指标 最 差 、 最 好 得 分 。 每 组 版 面 布 
局 都 以 随机 顺序 呈现 给 用 户 ， 部 分 版 面 布局 结果 如 图 13 所 示 。 由 于 ， 我 们 的 方 
法 将 产生 多 个 版 面 布局 , 其 目的 在 于 供用 户 参 考 与 选择 , 我 们 将 记录 每 组 版 面 不 
同 指标 下 的 最 高 分 数 和 平均 分 数 并 最 后 按 组 进行 平均 。 实 验 结果 如 表 4 所 示 。 

关于 可 读 性 ， 本 文 方法 、 规 划 方 法 与 新 手 生成 的 版 面 效果 相当 ， 略 差 于 专家 
版 面 。 这 是 比较 合理 的 。 可 读 性 主要 体现 在 新 闻 之 间 的 清晰 界限 和 新 闻 内 部 的 聚 
合 ， 对 于 模型 和 新 手 ， 是 能 够 较为 轻松 把 握 住 的 。 关 于 信息 性 与 美观 性 ， 本 文 方 
法 优 于 规划 方法 和 新 手 制作 的 版 面 ,因为 约束 保证 了 元 素 对 齐 以 及 新 闻 层 次 ,并 
追求 合适 的 新 闻 块 比例 。 对 于 新 手 而 言 ， 这 是 比较 耗 时 的 过 程 ， 尤 其 是 对 多 个 排 
版 元 素 进行 协调 调整 。 而 纯 规划 的 方法 可 能 会 导致 图 片 尺寸 过 大 或 过 小 , 影响 美 
观 性 和 信息 性 。 整体 上 ， 本文 方 法 要 优 于 新 手 制作 的 版 面 而 且 生 成 多 种 候选 布局 
可 供 排版 人 员 参 考 ， 以 启发 新 的 设计 灵感 。 

对 于 相同 的 版 面 内 容 , 纯 规 划 模 型 生成 的 版 面 和 本 文 方法 生成 的 版 面 差别 主 
要 在 于 头条 的 宽度 和 图 片 尺 寸 。 纯 规划 过 于 追求 全 局 和 矩形 比例 , 缺少 考虑 头条 和 
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图 片 尺 寸 ， 从 而 导致 整体 布局 的 变化 如 图 13 Cd) 。 用 本 文 方法 生成 的 布局 更 符 
合 历史 版 面 风格 。 有 趣 的 是 ， 当 新 闻 内 容 合适 的 时 候 ， 纯 规划 模型 也 有 一 定 概率 
成 具有 历史 风格 的 版 面 , 这 表示 专家 一 直 在 协调 排版 风格 和 整体 布局 比例 。 而 
我 们 的 方法 也 取得 了 排版 风格 和 整体 布局 比例 的 平衡 。 
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4 结论 与 展望 


本 文 提出 了 一 种 融合 学 习 与 规划 的 数字 报 版 面 布局 生成 方法 。 通 过 最 近邻 和 
贝 叶 斯 网 络 方法 推断 布局 结构 和 新 闻 属 性 , 并 基于 学 习 模型 的 预测 结果 建立 非 线 
性 整数 规划 模型 ， 减 小 模型 求解 空间 的 同时 ， 使 得 生成 的 版 面 布局 直观 、 易 读 且 
带 有 历史 风格 。 我 们 的 方法 可 以 生成 多 样 性 的 版 面 布局 ， 作 为 设计 辅助 工具 , 不 
仅 可 以 为 设计 新 手 生 成 布局 也 可 以 为 专业 人 员 提 供 设 计 参 考 与 选择 。 
作为 未 来 的 工作 ,我们 还 有 可 以 许多 扩展 的 地 方 。 目 前 , 我 们 注重 于 排版 元 
素 内 容 类 型 和 大 小 对 布局 的 影响 , 而 没有 考虑 到 新 闻 文 本 、 图 片 语义 和 布局 之 间 
的 联系 ; 此 外 ， 我们 对 于 文本 字体 类 型 和 颜色 需要 进一步 的 研究 ， 以 及 如 何 将 布 
局 方法 扩展 到 其 他 平面 设计 问题 ， 这 都 将 在 未 来 的 工作 中 解决 。 
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